草庐IT

php - UTF-8 与 PHP DOMDocument loadHTML?

全部标签

Ruby 将 CSV 文件读取为 UTF-8 和/或将 ASCII-8Bit 编码转换为 UTF-8

我正在使用ruby1.9.2我正在尝试解析包含一些法语单词(例如spécifié)的CSV文件,并将内容放入MySQL数据库中。当我从CSV文件中读取行时,file_contents=CSV.read("csvfile.csv",col_sep:"$")返回的元素是ASCII-8BIT编码的字符串(spécifié变为sp\xE9cifi\xE9),然后像“spécifié”这样的字符串没有正确保存到我的MySQL数据库中。YehudaKatz表示ASCII-8BIT实际上是“二进制”数据,这意味着CSV不知道如何读取适当的编码。所以,如果我尝试让CSV强制编码如下:file_cont

ruby - 导入csv数据时,如何去掉 "invalid byte sequence in UTF-8"

我们允许用户通过csv导入数据(使用ruby​​1.9.2,因此它是更快的csv)。作为用户数据,当然,它可能没有得到适当的清理。当我们尝试在/index方法中显示数据时,我们有时会收到错误“UTF-8中的无效字节序列”,指向我们显示字段widget.name之一的erb当我们进行导入时,我们希望强制传入的数据有效...是否有一个ruby​​运算符可以将字符串映射到有效的utf8字符串,例如,类似goodstring=badstring.no_more_invalid_bytes“坏”数据的一个示例是char,它看起来像连字符,但不是常规的ascii连字符。我们更愿意将非utf-8字符

ruby-on-rails - 不兼容的字符编码 : ASCII-8BIT and UTF-8

我使用Ruby1.9.2和Rails3.0.5我有以下错误:incompatiblecharacterencodings:ASCII-8BITandUTF-8我认为这与数据库无关。错误发生在View中的这一行(只是一个divhaml调用):#content全栈:ActionView::Template::Error(incompatiblecharacterencodings:ASCII-8BITandUTF-8):21:-flash.eachdo|name,msg|22:=content_tag:div,msg,:id=>"flash_#{name}"23:%div.clear24:

ruby-on-rails - PG::错误:错误:新编码(UTF8)不兼容

我已经从源代码安装了postgresql-9.2.4,现在当我执行时在railsapp中:rakedb:create命令我得到:$bin/rakedb:createRAILS_ENV="test"PG::Error:ERROR:newencoding(UTF8)isincompatiblewiththeencodingofthetemplatedatabase(SQL_ASCII)HINT:Usethesameencodingasinthetemplatedatabase,orusetemplate0astemplate.:CREATEDATABASE"verticals_test"E

ruby 1.9 : invalid byte sequence in UTF-8

我正在用Ruby(1.9)编写一个爬虫程序,它使用来自大量随机站点的大量HTML。在尝试提取链接时,我决定只使用.scan(/href="(.*?)"/i)而不是nokogiri/hpricot(主要加速)。问题是我现在收到很多“UTF-8中的无效字节序列”错误。据我了解,net/http库没有任何特定于编码的选项,而且进来的东西基本上没有正确标记。实际处理传入数据的最佳方式是什么?我尝试使用.encode设置替换和无效选项,但到目前为止没有成功... 最佳答案 在Ruby1.9.3中,可以使用String.encode来“忽略”无

javascript - 如何在 jquery 或 javascript 和 PHP 中将 GPS 度数转换为十进制,反之亦然?

有人知道如何将GPS度数转换为十进制值,反之亦然吗?我必须开发一种用户可以插入地址并获取GPS值(度数和/或小数)的方法,但我需要知道的主要事情是如何转换这些值,因为用户也可以插入GPS值(度或小数)。因为我需要从谷歌地图获取map,所以需要小数点。我已经尝试了一些代码,但我得到了很大的数字......就像这个:functionConvertDMSToDD(days,minutes,seconds,direction){vardd=days+minutes/60+seconds/(60*60);//alert(dd);if(direction=="S"||direction=="W")

javascript - 将 PHP hash_hmac(sha512) 转换为 NodeJS

我正在移植一个php脚本到node,我对加密不是很了解。php脚本使用了这个函数:hash_hmac('sha512',text,key);因此,我需要在Nodejs中实现一个函数,以使用hmac方法(SHA512)返回键控哈希。据我所知,Node通过加密模块(http://nodejs.org/docs/latest/api/crypto.html#crypto_crypto)内置了此功能——但我不清楚如何重现此功能。如有任何帮助,我们将不胜感激。谢谢, 最佳答案 是的,使用加密库。varhash=crypto.createHma

javascript - Node 编码和解码 utf-16 缓冲区

我正在处理需要与C++tcp/udp套接字通信的javascript/nodejs应用程序。好像我从旧的C++客户端那里得到了一个utf16缓冲区。我现在没有找到将其转换为可读字符串的解决方案,而另一个方向似乎也是同样的问题。这两个方向有没有简单的方法?亲切的问候 最佳答案 如果您有一个UTF-16编码的缓冲区,您可以像这样将它转换为UTF-8字符串:letstring=buffer.toString('utf16le');要从流中读取这些,最简单的方法是在最后使用转换为字符串:letchunks=[];stream.on('dat

javascript - 没有编码为 UTF-8 或 base64 的 websocket 二进制数据

我正在尝试使用二进制模式的websockets将二进制数据从用Python编写的服务器传输到客户端浏览器(运行javascript)。我已经以文本模式实现了这种通信,但现在我希望通过以二进制模式进行通信来提高性能。我见过的所有示例(例如this,如果有人深入了解使用Tornado的matplotlib/webagg的源代码)都声称它们使用的是二进制模式,但实际上它们似乎对原始二进制数据进行了编码在传输之前的某个时刻转换为UTF-8(或base64)。在我看来,这样做并不是真正的二进制传输,因为它会增加30%到50%的开销。所以我的问题是,是否必须将二进制数据编码为utf-8或base6

javascript - 使用 XMLHttpRequest 获取非 utf8 数据

我想使用xmlHttpRequest从Web获取文档。但是,有问题的文本不是utf8(在本例中是windows-1251,但在一般情况下,我不确定)。但是,如果我使用responseType="text",它会将其视为字符串是utf8,而忽略内容类型中的字符集(导致一团糟)。如果我使用“blob”(可能是我想要的最接近的东西),我可以将其转换为考虑编码的DomString吗? 最佳答案 我实际上从这里找到了一个API来做我想做的事:https://developers.google.com/web/updates/2014/08/E